【文章精选】方学梅、高煜辰、樊妍妮丨公众如何感知公共组织绩效？——基于两项大样本复制实验的证据丨2024年第4期

Original 方学梅等公共管理与政策评论

2024-09-24

公众如何感知公共组织绩效？——基于两项大样本复制实验的证据

◉方学梅高煜辰樊妍妮

【摘要】公共组织的绩效是公共管理研究长期关注的主题。本文复制了Hvidman的实验，在中国情境下分别进行了两项调查实验。实验一以为中小企业提供融资服务的风险基金作为实验情境，探讨了组织属性（公共/私立）如何影响公众对组织整体绩效的评估以及公共组织信念的调节效应，获得有效样本2103份；实验二以居家护理服务为实验情境，探讨了与私人组织相比，公众如何在多个绩效维度（效果、繁文缛节、成本控制、用户导向、用工公平、服务平等）上评价公共组织，获取有效样本2131份。结果发现：组织的公私属性、个人的公共组织信念均不会影响公众的感知绩效；公私两类组织在多维绩效上也并不存在显著差异。通过复制实验，本文发现在中西方不同的情境下，实验结果有较强的情境依赖性，理论的边界需要进行探讨。

【关键词】感知绩效；复制实验；公共组织

【作者介绍】方学梅：华东理工大学社会与公共管理学院副教授，fangxuemei0111@163.com。高煜辰：华东理工大学社会与公共管理学院硕士研究生，abc53105@163.com。樊妍妮：华东理工大学社会与公共管理学院硕士研究生，diudiufyn@163.com。

【引用格式】方学梅, 高煜辰, 樊妍妮. 公众如何感知公共组织绩效?——基于两项大样本复制实验的证据[J]. 公共管理与政策评论, 2024, 13(4): 74-87.

—文章结构—

一、引言

二、文献综述

（一）公众对公共组织的感知绩效

（二）公共组织信念对感知绩效的影响

（三）组织绩效维度

三、研究一：公共组织线索对绩效评估的影响

（一）实验情境

（二）变量与模型

（三）数据搜集与平衡性检验

（四）数据分析

四、研究二：公共属性对多个绩效维度的影响

（一）实验情境

（二）变量与模型

（三）数据搜集与平衡性检验

（四）数据分析

（五）稳健性检验

五、结论与讨论

（一）研究结论

（二）进一步的讨论

（三）理论意义

（四）实践启示

（五）不足与展望

一、引言

公共组织的绩效是公共管理研究长期关注的主题。公众对公共组织的感知绩效对国家的经济和社会整体福祉有着至关重要的影响。有研究表明，公众不信任公共组织的绩效信息，总是将公共组织与无效和浪费联系在一起。对公共组织的负面看法既不利于公共组织的发展，也对有效的公共管理起到了阻碍作用。然而，公众在多大程度上对公共组织抱有负面看法，这种看法是否普遍存在于公众之中，仍需更多的研究进行探讨与验证。

Hivdman研究了组织的公私属性如何影响公众对组织的感知绩效这一问题。该研究在丹麦公民中开展了两项大规模实验。研究一考察了公众对组织的感知绩效是否会受到他们是否相信该组织是“公共的”影响，以及这种影响是否会因个人对公共组织预先存在的信念而变化。研究二是研究公众如何在多个绩效维度上对公共组织（与私人组织相比较）进行绩效评估。结果表明，组织的公共性会显著降低公众对该组织的整体绩效评估，但会根据被试的先前信念产生不同的效应。另外，公众对公共部门的态度可能是多方面的，而且可能并不总是消极的。公共组织可能被认为不如私营组织有效，但其产出分配被认为更加公平。

然而，不同的人群特征和政治环境可能会影响公众对组织的感知绩效，研究的主要发现能否在其他情境下得到复制，是对理论的进一步发展。上述实验是在丹麦情境下开展的，丹麦是“社会民主主义”模式的福利国家，具有高福利、高税收的特点。由于中国与丹麦在政治制度、社会保障、文化等方面有着诸多不同。那么在中国情境下，原实验的研究结论是否依旧成立？本文将在中国情境下，复制上述实验，研究组织的公私属性对公众感知绩效的影响。复制实验可根据数据库、样本总体、测量方法与分析分为六种类型，本文采用“实证推广”的复制类型，使用与原实验相同的测量与分析方法，研究不同的群体，加强原实验结论的外部效度。同时，在不同的国家背景下进行复制实验也能够对宏观问题进行探讨。

对此，本文提出如下问题：（1）公众对公共组织和私人组织的绩效感知是否存在差异？（2）哪些绩效维度存在差异？（3）西方国家情境下的实验能否在中国得以复现？

二、文献综述

（一）公众对公共组织的感知绩效

组织的公私属性可以根据所有权和资金来源进行简单划分，公共组织由纳税人出资并受一定程度的社会控制，而私人组织资金来源于消费者或股东，受市场机制的约束。现有研究已经分析了公众对公共组织的看法或态度。当公众对社会服务感到不满意时，他们更有可能将提供服务的组织误认为是政府。此外，公众会怀疑政府来源的绩效信息，尤其是当政府工作报告高绩效水平时，公众的怀疑更甚。这种对公共组织持续的、负面的刻板印象通常被称为“反公共部门偏见”。Marvel将反公共部门偏见定义为公众在没有证据支持的情况下，对公共部门表达出负面的态度，或者公众在有证据表明公共部门或其雇员表现良好的情况下，对公共部门仍表达出负面的态度。

为了排除其他因素的干扰，验证公众对一个组织是否公共的看法会影响他们对其表现的态度，最近的实验研究在这方面取得了很大的进展。实验研究可以操作组织属性，将被试进行随机分组，以此分离出组织的公私属性对被试感知组织绩效的影响。Hvidman和Andersen以丹麦医院为背景进行了实验，结果表明，公众认为公立医院的繁文缛节显著多于私立医院，且公立医院的效率显著低于私人医院，但仁爱和效果方面的差异并不显著。吴建南、刘遥在中国情境下对Hvidman和Andersen的实验进行了复制，结果表明公众认为公立医院的繁文缛节相较私立医院更多，在效率、效果、仁爱方面无显著不同。然而，有部分研究发现，公众对公私组织的感知绩效并无差异。Meier等人也复制了Hvidman和Andersen的实验，发现美国公众对公立医院和私立医院的评价没有什么不同。此外，Meier等人还比较了公众对政府所有、非营利性、营利性养老院的感知绩效，公众对私人营利性养老院的感知绩效在任何情况下都未明显优于政府所有的养老院，非营利性养老院在效率、效果、公平等维度上被认为比营利性养老院做得更好，在养老院护理领域甚至存在着反营利性组织偏见。

上述研究为组织的公私属性和感知绩效之间的因果关系提供了强有力的证据，排除了公共组织与私人组织之间其他差异的可能性，也表明了公众并不总是对公共组织持有负面的看法，需要在具体的情境与背景下进行讨论。在中国情境下，中国政府仍然是一个强政府，市场与社会的发展既受到政府的严格管治，也高度依赖政府。与西方国家的情况相比，中国公众对公共组织的依赖程度更高，对公共组织角色的看法或态度也更积极。因此，在中国情境下，公众对公共组织的感知绩效可能显著优于私人组织。

（二）公共组织信念对感知绩效的影响

个人通常会根据自己的喜好推理出他们喜欢的结论，个人动机会微妙影响证据的收集方式、论点的处理方式以及如何回顾过去的经验。心理学将上述现象称为动机推理（motivated reasoning），动机推理是一种减少认知失调的类型：人们在做决定时试图符合他们先前持有的价值观和信念。已有学者将动机推理理论应用于解释公众的政治行为。Taber和Lodge研究发现，在评估一项政策或法案时，公众会反驳与先前信念不一致的论点，而不加批判地接受与先前信念一致的论点。Slothuus和De Vreese通过两个实验表明，当议题框架由他们投票支持的政党提出时，公众倾向于做出更积极的反应，公众试图通过调整对政策的支持来确保与之前的投票选择保持一致。

当公众评估公共组织的绩效时，并不是从一张白纸开始搭建对公共组织的信念。公共组织比大多数私人组织更为复杂，这种复杂性使得公众评估绩效更加困难，先前的信念可以帮助公众更容易地对具体的公共服务形成判断。Marvel指出对公共组织的负面看法是预先存在的，与公共组织和雇员的长期信念、假设和关联相关，这些信念、假设和关联可能是无意识的、根深蒂固的和自发激活的。公众对公共组织的信念是差异化的，并不总是负面的。公共组织的大多数议题往往都具有讨论性，例如，公共服务的提供应该是公共的还是私人的。面对这些具有讨论性的议题，每个人都有自身所秉持的价值观和信念。根据动机推理理论，先前的信念可能会影响公众理解组织绩效信息和评估组织绩效，公众对某一特定公共组织的感知绩效可能是可以预测的。Jakobsen和Petersen通过对公立高中教师的大规模调查实验，考察了街头官僚如何看待公共和私营部门的绩效，结果表明，街头官僚的绩效感知反映了明显的部门偏见，强烈偏向于公共组织，这种偏见的强度受到个人工作经验和政治价值观的制约。James和Van Ryzin研究公众如何判断平价医疗法案时发现，公众会根据自身的党派身份对绩效报告进行有动机的推理。Baekgaard和Serritzlew通过实验研究表明即使是客观、清晰和明确的绩效信息，也会受到有偏见的解释，这取决于信息是否与个人所持有的先前信念一致。

上述研究表明，个人对公共组织的信念会影响其对公共部门的评价。如果个人对公共组织的先前信念是消极的，那么这意味着，如果他知道组织是公共的，他就可能对组织的绩效给予负面评价；如果个人对公共组织持有积极的信念，那么当他知道组织是公共的时，就有可能对组织的绩效给予积极的评价。

（三）组织绩效维度

绩效是公共管理中的一个重要，甚至可能是最重要的概念。组织绩效是指一个组织实际目标的达成情况，是一个多维度的概念。衡量组织绩效有助于评估组织现状，作出决策，从而提高组织的服务质量。原实验将感知绩效划分为六个维度，分别是“效果”（effectiveness）、“繁文缛节”（red tape）、“成本控制”（cost containment）、“用户导向”（user orientation）、“用工公平”（fairness）和“服务平等”（equity）。为与原实验结果进行比较，本文将采用上述六个绩效维度进行分析。

与传统的公共行政相比，新公共管理在强调效率的同时也更注重效果。效果是指提供服务的质量与品质，有效地完成核心任务是任何组织的主要目标。公众对组织的感知效果是指个人认为一个组织有能力且有效地完成其核心任务的程度。

繁文缛节是指某些规则和程序，这些规则和程序对于利益相关者的目标或者价值的贡献低于花在这些规则和程序上的遵从和执行的成本。公众对组织繁文缛节的感知是指人们认为一个组织拥有高度烦琐的行政规则和程序，且遵从的成本高于贡献。相较私人组织，公共组织似乎拥有更多的繁文缛节。

成本控制也是组织重要的绩效标准。虽然新公共管理运动提倡“结果导向”，但是并不能忽视公共组织绩效的投入。组织应当以尽可能低的成本提供服务，提高成本效益。公众对成本控制的感知是个人认为组织能够控制成本的程度。

用户导向与公共服务动机相关。公共服务动机更为普遍地存在于公共组织中，它以提供公共服务为基础，受到公共组织价值观和使命的激发，表现出利他主义行为或亲社会行为。公众对组织用户导向的感知是指个人认为一个组织真正关心用户利益的程度。

公共组织在运行过程中不会脱离对公平的追求。组织公平是指在结果、程序、互动等方面，组织能够公平公正地对待员工。在组织绩效中，人们往往关注减少繁文缛节、提高效率和效果，用工公平并未得到重视。公众对组织用工公平的感知是指个人认为组织在多大程度上公平公正地对待员工。

平等也是公共管理长期关注的核心价值理念，公共管理中的平等强调“公平公正的待遇，以及向整个社会平等和公正地分配利益”。公众对服务平等的感知具体是指个人认为组织平等提供服务的程度。私人组织的营利导向使得私人组织更倾向于针对不同的人群提供差异化的服务。虽然新公共管理等绩效导向的市场化改革可能会使公共服务的公平性有一定的损失，但平等地提供公共服务始终是公共组织追求的价值目标。

上述绩效评估的六个维度中，一些与生产力密切相关，如效果、成本控制等；另一些与绩效的规范性相关，如用工公平与服务平等。公共组织通常被认为在与生产力相关的绩效方面表现不佳，但是在与公平和平等相关的绩效维度上评价更积极。

为了研究公众对公共部门的评价，参照原实验设计，本文开展了两项针对普通公众的大样本实验，每项实验的样本量都在2000以上。第一个研究主要探讨公共组织线索对绩效评估的影响，以及公共组织信念的调节效应；实验情境是为有潜力的中小型企业提供股权投资、贷款等服务的风投基金。第二个研究的目的是探讨公众如何在不同的绩效维度上评价公共组织和私人组织，实验情境是为老年人提供清洁、穿衣、做饭等居家护理服务。

三、研究一：公共组织线索对绩效评估的影响

（一）实验情境

研究一探究在提供公共组织线索的条件下公民对组织绩效评估的反应。原实验情境是一家为政府所有的风投基金，主要为有潜力的中小型企业提供股权投资、贷款等。原实验采用该情境是因为在丹麦既有公共组织运作的风投基金，也存在私人组织运作的风投基金，因此如果一项风投基金未得到充分的关注，公众难以判断该风投基金是否属于公共组织。在中国，风投基金更多地被认为是私人组织，因而也可以通过实验处理，影响被试对组织公共性的看法。

研究一翻译了原实验的实验情景，包含个人信息、公共组织信念、名为“成长基金”的风投基金简介与绩效评价。被试被随机分配到两种实验条件。第一组没有被明确告知“成长基金”是否公有；第二组则得到了该组织所有权为政府的信息。具体实验情境如下：

关于某成长基金某成长基金是一家[插入提示：“公共”]公司[插入提示：“100%为中国政府所有”]旨在促进中小企业的成长。成长基金由一个专业委员会管理，其使命是“为中小型企业的营利性和风险性增长提供共同融资”。活动包括：1.对初创公司的投资。成长基金以股权形式投资于难以获得足够风险资本的具有高增长潜力的初创公司。2.为已成立的中小型企业提供贷款。成长基金直接向具有良好增长计划的中小型企业提供贷款。成长基金的成果—成长基金有105名员工。—2021年，成长基金的净收入为8.39亿元，与2020年的9.03亿元相比，下降了7.1%。—该公司2021年的行政费用为1.48亿元，与2020年相比增加了30.6%。增长的主要原因是员工人数不断增加，因此薪酬和工资也随之增加。—2021年的年度利润为7.23亿元，比2020年低11.2%，2020年是公司创纪录的一年。—2021年的年度利润被转移到股份中，增加了20.5%，达到约40亿元。

阅读完实验情境后，被试对该组织绩效进行评分，且在打分后，被试要判断该组织是“公共的”还是“私人的”。

（二）变量与模型

1.变量测量

（1）因变量：公众对组织的感知绩效。被试被问及：“某成长基金的表现如何？”评分范围从“非常差”（0分）到“非常好”（100分）。分值越高代表相应的绩效也越高。

（2）自变量：公共组织线索提示。无公共组织线索提示的对照组赋值为0，有公共组织线索提示的实验组赋值为1。

（3）调节变量：公共组织信念。由三道题组成：“从长远来看，我们不可能维持今天所知的福利水平”“我们仍然有可能在不影响公民服务的情况下大幅削减公共开支和精简公共部门”“如果交给私人实体，许多公共活动可以更好和更便宜地进行”。选项采用李克特五级量表，由“非常同意”到“非常不同意”（1—5分）。接着使用了主成分分析，并将数据进行了标准化处理。得分越高，公共组织信念越高。

2.测量模型

研究一使用工具变量来估计组织公共性感知的因果效应，将公共部门线索的实验处理作为工具变量。工具变量的估计量如公式（1）所示：

其中，Y是标准化的组织评价得分，平均值为0，标准差为1；CUE是实验处理的指标变量（即公共组织线索=1；对照组=0）；Public是受访者是否认为该组织是公共组织的指标变量（即公共=1；私人=0）。分子是实验处理对结果的影响，换言之，也就是实验组和对照组之间的绩效评估的平均差异。分母是工具变量和实验组之间的关系，也就是说，在公共组织和对照组的个体之间，将该组织确定为公共组织的比例的差异。对于“成长基金”是否“公共的”看法的差异是由实验线索引起的。同样，实验线索也推动了“成长基金”绩效评估的变化。在排除限制的条件下，绩效评估（分子）的变化仅由实验线索对组织公共性感知（分母）的影响引起。研究一使用带控制变量的两阶段最小二乘估计（2SLS）进行分析。

（三）数据搜集与平衡性检验

研究一分别于2022年5月17—20日、2023年1月2—4日，通过“Credamo见数”平台发放问卷2360份，回收有效问卷2103份，被试对象均为18岁以上的中国公民。表1显示了本研究参与者和我国一般人群的人口学背景特征。与我国2020年的人口普查数据相比，本研究样本受教育水平较高、以中青年群体为主。这是因为本研究调查的对象主要是城市中青年居民，故受教育水平较高，这是合理的。同时，本研究以列联表的形式使用卡方检验与ANOVA方法对实验组与对照组的样本进行了平衡性检验，其中对于分类变量运用卡方检验的方法，对于数值型变量则采用F检验。检验结果如表1所示，两组样本在年龄、受教育程度、性别、职业等方面均不存在统计意义上的显著差异，能够有效避免系统误差。

（四）数据分析

表2比较了不同的实验处理对于公众对成长基金的绩效评价。第1行显示了被分配到公共组织线索组与对照组的受访者在绩效评估上的差异。结果显示，当受访者被告知组织是公共组织时，其对组织的整体绩效评分更高。第2行比较了不同条件下公众对组织公共性的感知。对照组仅有43.3%的人认为“成长基金”为公共组织；而在线索提示条件下，高达92.9%的人感知为公共组织，提高了49.6%。第3行显示了工具变量估计，使用公众对组织公共性的感知变化来估计效果，其效应为0.024。

表3进一步展示了OLS和2SLS结果。第1列显示了第一阶段的估计，表明微妙的处理线索能够有效地校准受访者的感知。当受访者被告知组织是公共组织时，能够显著提高公众对该组织公共性的感知。第2列的结果显示，提供公共组织线索的实验处理对被访者的组织绩效评分没有显著影响。第3列显示了工具变量估计为0.025，然而其效应并不显著。上述结果均与表1中的无条件估计结果十分接近。

上述研究发现与原实验的共同点在于，向被访者提供公共组织线索的实验处理都能够显著提高被试对于该组织公共性的感知。此外，原实验表明，提供线索的实验处理与公众对该组织公共性的感知都会显著降低其对该组织的整体绩效评估。然而，在本研究中未发现存在统计学上的显著效应。可能是由于中西方的研究情境导致的，对此本研究将后续予以讨论。

为了研究公共线索干预效应的异质性，本研究进一步检验了公众的公共组织信念是否对公共线索干预与绩效评分之间存在调节作用。如表4所示，交互项结果并不显著，表明对于公共组织有着积极或消极的既有信念，并不会对公共线索干预后的绩效评分造成统计学上的显著差异。提供公共线索的干预与公众的倾向之间不存在很强的异质性。

本研究也与原实验保持一致，采用了基于线性交互作用假设的检验方法，并绘制了公共组织信念调节下的公共组织线索干预对于公众绩效评价的边际效应图。并且按照被试公共组织信念的不同水平，将其分为五组（分别对应五个分位数），运用箱型估计量（binning estimator）开展组内估计。如下页图1所示，展示了在不同的公共组织信念水平下，公共线索干预对于公众绩效评价的边际效应。在全部五组公共组织信念水平之下，每组区域的置信区间均包含0，表明各组的边际效应在统计学意义上均不显著。由此可见，与原实验结果不同，被试群体对于公共组织信念的不同倾向并不会对公共线索干预后的公众绩效评分产生显著影响。

四、研究二：公共属性对多个绩效维度的影响

（一）实验情境

研究二的主要研究目的是探究被试如何在不同的绩效维度上评价公共组织和私人组织。原实验的实验情境是老年人居家护理，即在老年人家中提供清洁、穿衣、做饭等护理服务。研究二沿用了原实验的实验情境，通过老年人居家护理服务比较公众对私人组织和公共组织的看法。在中国，公共组织与私人组织均提供老年人居家护理服务。国家卫生健康委发布的《关于开展老年医疗护理服务试点工作的通知》要求“引导区域内部分一级、二级医院转型为护理院，或支持社会力量举办规模化、连锁化的护理站、护理中心等”，同时“按需分类为老年人提供多层次的机构护理、社区和居家医疗护理服务”。因此，原实验情境在中国背景下仍然适用。调查问卷内容翻译自原实验问卷，包含个人信息、对老年人居家护理服务的了解、公共组织信念、居家护理机构简介与绩效评价。在居家护理机构简介部分，仅将机构名称“Health & Care”改为“某康养中心”，具体介绍如下：

某康养中心是一个[公共/私人]组织，有200名员工，提供老人护理，包括协助清洁、洗澡和准备膳食。

该康养中心分为七个部门，每个部门都有自己的经理。主任和行政经理负责该[公共/私人]组织的日常运作。

该康养中心的目标是提供最高质量的老年护理，同时考虑到个别用户的特殊需要。

该康养中心收集了病人满意度的数据。2021年，86%的患者表示满意。

被试被随机分配到“公共组织”和“私人组织”的实验情境中。实验情境主要是向被试者展示了一张虚构的居家护理服务机构网站的截图，该截图提供了上文所展示的机构简介，包含背景信息、内部组织架构、组织目标和绩效信息。研究一证实了向被试提供公共组织线索的实验处理都能够显著提高被试对于该组织公共性的感知，因此除“公共组织”与“私人组织”的提示不同，其余表述均一致。被试需要从以下六个维度评估组织的绩效，分别是“效果”“繁文缛节”“成本控制”“用户导向”“用工公平”和“服务平等”。

（二）变量与模型

1.因变量

研究二的因变量为公众对组织的感知绩效，具体包含“效果”“繁文缛节”“成本控制”“用户导向”“用工公平”“服务平等”六个因变量，采用11级李克特量表衡量（0—10），并对数据进行了标准化处理。分值越高代表相应的绩效也越高。具体测量题目见表5。

2.自变量

自变量为组织的公私属性，私人组织赋值为0，公共组织赋值为1。

3.计量模型

本研究使用普通最小二乘法（OLS）回归估计组织的公私属性对绩效评价的影响。本研究模型如下：

其中，Yi是个体i对组织的绩效评价，CUEi是组织的公私属性，Xi是控制变量，ei是误差项。

（三）数据搜集与平衡性检验

研究二分别于2022年5月17—20日、2023年1月2—4日，通过“Credamo见数”平台发放了2426份问卷，被试对象为18岁以上的中国公民，有效样本量为2131份，样本特征见表6。由于本研究调查的对象主要是城市中青年居民，故受教育水平较高，这是合理的。为了检验对照组与实验组样本分布的平衡性，本研究使用卡方检验对分类变量（年龄、受教育程度、性别、职业、先前经验）进行检验，使用F检验对连续变量（公共组织信念）进行检验，具体结果如表6所示。结果表明，实验组与对照组在性别、年龄、职业等方面的差异并不显著，两组实验的样本分布较为均衡，能够较好地避免系统误差。

（四）数据分析

表7是在没有控制变量的情况下OLS回归分析的结果。虽然公共组织在效果、繁文缛节、用户导向方面存在些许负面印象。但是经显著性检验结果表明，公众认为在效果、繁文缛节、成本控制、用户导向、用工公平、服务平等这六个方面，公共组织与私人组织不存在统计学意义上的显著差异（见表7）。这与原实验结果不同，原实验中公众对两种组织在效果、繁文缛节、服务平等这三方面的绩效感知上是存在显著差异的。

（五）稳健性检验

本研究借鉴了原实验的做法，加入性别、年龄、高等教育、职业、公共组织信念、先前经验这些控制变量后，检验结果是否依旧稳健。稳健性检验结果如表8所示，纳入控制变量后，结果依旧稳健，组织的公私属性对公众的感知绩效仍然没有显著的影响。从控制变量来看，先前经验，即被试对老年人居家护理服务的了解，会对公众的感知绩效产生十分显著的影响。有相关经验的公众会认为公共组织在效果、成本控制、用户导向、用工公平、服务平等方面显著优于私人组织，但是相较于私人组织，其认为公共组织存在更多的繁文缛节。另外，相较于男性，女性认为公共组织的繁文缛节显著高于私人组织。与18—34岁的被试相比，35—49岁年龄段的被试在繁文缛节、成本控制、用户导向、服务平等方面相较其他年龄段存在显著差异。与在公共组织就业的被试相比，未就业被试认为公共组织在效果、成本控制、用工公平、服务平等方面均显著低于私人组织。稳健性检验再次验证了，在中国情境下，组织的公私属性并不会影响公众对组织的绩效评价与感知。

五、结论与讨论

（一）研究结论

本文在中国情境下，检验了组织的公私属性是否会对公众的感知绩效产生影响。本文的研究发现与原实验既有共同之处，也有不同之处。相同之处在于：两次实验中，在成本控制、用户导向、用工公平方面，公众对公共组织和私人组织的感知绩效均不存在显著差异。不同点在于：原实验发现组织的公私属性会影响公众对组织的感知绩效，公共线索的影响高度依赖于个人对公共组织的信念，但本文发现组织属性对组织绩效评价的影响相对较低，且个人对组织的信念并不会影响个人对组织的绩效评估。此外，原实验发现在效果、繁文缛节方面，公共组织被认为比私人组织表现得更差，而在服务平等方面，公共组织比私人组织表现更为优秀。但本文得出公众对两种组织在效果、繁文缛节、服务平等这三方面的绩效感知上不存在显著差异。

（二）进一步的讨论

复制和结果不显著对理论发展是重要的。一项结果一致的复制实验能够证明样本、环境和程序的差异不是结论成立的决定因素，但结果不一致的复制实验有助于确定研究结论的边界条件。如果通过复制，原实验结论并没有成立，那么原实验和复制实验之间的某些差异可能是导致结论不同的原因。本文严格复制了原实验的实验设计，且样本的选择与数量也尽量与原实验保持一致。因此，原实验的结论未在本文中得到验证可能不能归因于实验设计。中国和丹麦实验结果的差异可能有以下原因：

首先，理论的可复制性和政策建议的可适用性具有较强的情境依赖性。在不同的国别背景下，即使是提供相同公共服务的组织也具有不同的特征，组织和公众之间的互动方式也不同，这些可能都会导致不同国家公众对同一领域的组织产生不同的看法。本文选择了与原实验相同的两个情境，分别是以为中小企业提供风投的基金和老年人居家护理服务。以老年人居家护理服务为例，丹麦的老年服务面向所有老年人，不论老人是否住在养老院、经济状况如何，都享有一视同仁的免费居家护理服务。在普惠的基础上，丹麦的私人组织可以提供额外服务并收取费用。中国目前的居家护理服务仍在探索和完善阶段，尚未达到普惠的阶段。因此，虽然选取了与原实验相同的实验情境，但由于两国社会福利制度的差异，被试对实验情境的理解与认知可能存在不同。例如，在服务平等方面，丹麦公众认为公共组织比私人组织表现更为优秀，而中国公众却认为两者无显著差异。本文与原实验的结论差异表明，在不同国家进行复制实验是对理论适用边界的探讨，具有重要的理论意义。

其次，不同的政治文化环境可能使公众对公共部门绩效的评价出现差异化。在原实验中发现的“反公共部门偏见”是一个诞生于西方情境下的概念，与西方社会在日常生活中对政府等公共部门的刻板印象有关，其公民往往将公共组织与缺乏灵活性、效率低下联系在一起，而这些都根植于西方的政治文化背景，深受社会契约论、人民主权理论等理念的影响。与之不同的是，当代中国是在中国共产党领导下的社会主义社会，在新中国成立后开展的一系列建设、改革、发展都离不开中国“强政府”治理体制的积极推动，与西方国家“小政府，大社会”的情景截然不同，中国政府在社会治理与提供服务中处在主导地位，中国社会与公众对于政府的依赖程度更高，对其角色认知也更为积极。由此可见，在中国独特的政治社会环境下，西方国家常见的“反公共部门偏见”现象在中国情景下很难产生，因而在本实验中向公众提供公共部门线索信息并不会给其绩效评价带来显著的负面影响。

此外，虽然我国公共服务朝着多元主体的方向发展，但公共组织仍然是公共服务供给的主要主体，且存在供给侧结构性失衡的问题，导致供给无法精准触及民之所需，因而公共组织在效果、成本控制、用户导向、用工公平和服务平等方面并没有获得比私人组织更好的评价。这与吴建南等学者的发现一致，公众认为公立医院的繁文缛节显著高于私立医院，效果、效率、仁爱方面两者无显著差异。所以在中国情境下，公众认为公共组织和私人组织在多维度绩效上并没有显著的差异。

（三）理论意义

第一，本研究采用复制实验的方法，为复制实验的设计与实施提供了参考。尽管实验在公共管理研究中的使用日渐增多，但是关于复制实验相当缺乏。在公共管理领域开展复制实验不仅有助于检验以往研究发现的有效性，也有助于拓展研究发现在不同样本或情境中的可推广性。但是复制实验根据研究对象、数据、方法和分析的不同分为不同的类型，本文采取了其中一种，为该类复制实验的实施提供了参照，有助于推动复制实验在公共管理研究中的应用与发展。

第二，本研究为公众如何感知公共部门的绩效提供了中国样本。西方社会长期以来一直将公共部门与无效和浪费联系在一起，存在着“反公共部门偏见”，这一偏见是否具有普遍性，需要在不同国家进行检验，而中国在该领域的研究非常匮乏。本研究采用两项大样本的调查实验，对中国公众的公共部门绩效感知进行了研究，研究发现在中国并不存在“反公共部门偏见”，这是对既有理论的检验和拓展。

（四）实践启示

第一，提升公共服务供给质量。研究结果表明公众对公共组织的偏见并不是普遍存在的，这从侧面表现出公众对我国的公共组织具有一定的信任与信心。在新时代社会治理的背景下，人民群众的获得感、满意度被反复强调，社会治理取得了一定的成效。虽然组织的公私属性并不会影响公众对组织绩效的评估，但公众对公共组织的绩效感知普遍不如私人组织。相较私人组织，在效果、繁文缛节、用户导向方面公共组织仍然有提升的空间。公共组织要有效地提供高质量的公共服务，厘清和简化行政规则和程序，发展以用户为导向的公共服务供给环境。

第二，提高公共组织的公平公正。公共组织的公平公正既包含提供平等的公共服务，也包含组织内部的用工公平。本研究发现，公众并不认为公共组织在用工公平、提供平等的公共服务上优于私人组织。一方面，党的十九大报告提出了几乎覆盖人类生命全周期的公共服务标准，包括幼有所育、学有所教、劳有所得、病有所医、老有所养、住有所居、弱有所扶，保障公众享有基本的公共服务是公共组织的重要职责。因此，公共组织有义务推进公共服务均等化和可及性，加强公共服务基础设施建设，缩小不同人群的公共服务供给差距，保障社会公平。另一方面，公共组织的用工公平需要得到更多的关注。公共组织需要在结果、程序、互动等方面给予员工公平公正的待遇，提高组织公平性。

第三，加强对外宣传，主动公开绩效信息。本文的研究结果发现个人对公共组织预先存在的信念或看法并不会影响绩效感知，动机推理的影响有待进一步的证实。公众能够根据他们接触到的绩效信息改变他们的观点，公众的感知绩效具有一定的可塑性。因此，公共组织需要有效地向公众传达组织绩效，通过多种途径加强对外宣传组织绩效的策略，以此提升公众对组织的了解与认可度。

（五）不足与展望

首先，本文并未深挖公众感知绩效背后的心理机制，而了解公众为何如此评价公共组织绩效以及如何改变公众的看法，可能会对公共组织如何树立更好的声誉作出重要贡献。其次，提高绩效衡量标准的可靠性和有效性至关重要。原实验采用的绩效评价都是单道题，这会带来较大的误差，难以评估测量工具的信效度。即使是多道题也可能存在测量工具可靠性问题，由于目标的模糊性，衡量公共组织的绩效可能具有固有的主观性和挑战性。文中所列的绩效评价维度可能对不同文化背景的公众并非都有意义。因此，不断努力在各种情况下复制和检验绩效衡量标准的可靠性，将是改善此类衡量标准质量的宝贵一步。再次，本文只研究了两种公共服务情境，还需要在不同类型的公共服务中进行复制实验。例如，教育、医疗、环境保护等不同的公共服务有不同的运作方式，公众的感知可能会存在差异。最后，本文是基于调查实验法开展的研究，未来的研究可尝试实地实验等方法，进行更多的探讨。

此外，本文总结了一些在本次复制实验过程中获得的经验与教训，以便为今后公共管理领域开展复制实验提供参考。第一，在实验设计时需要充分考虑实验情景以及测量工具适用性的问题。原实验所使用的干预材料内容、测量量表中的题项设置可能仅适用于一些特定的环境，在移植到与原实验情景差异较大的环境中时需要进行本土化调整。以本次复制实验为例，原实验使用的题项内容涉及“福利国家”的有关表述，而中国不同于原实验中的丹麦，因此本研究在题项设计时结合我国国情进行了调整，使用了有关“福利水平”的表述。第二，在数据收集方面要考虑收集方法和样本的相似性。例如，原实验是借助YouGov线上平台的方式，便于招募大量的实验对象。而在我国找到与之相匹配的在线招募平台并不容易，从而很难保证样本特征的相似度。第三，数据分析方法的选择上也要充分考虑。如原研究在实验一中所使用的箱型估计量（binning estimator）绘制边际效应图就属于一种前沿且在国内相关领域并不常见的方法，在复制实验中若需严格遵循并使用与原实验中一致的数据分析方法，就需要对其有所了解并学习掌握。

本文提供了一个公众对公共和私人组织绩效的评价没有差异的案例，展示了公私差异和政府服务评估的中国样本，丰富了公共管理复制实验的研究发现。希望未来学者们在定量分析、实验和测量评估方面进行更多的复制研究，并期望期刊能发表更多结果不显著的研究。

扫描二维码免费下载全文

本期目录

更多精彩敬请关注

深入学习贯彻党的二十大精神

李宝荣丨中国式现代化进程中推进公共服务的战略路径与理论创新

专题研讨：数字治理研究

梁海伦丨专题引论：数字治理研究

王翔白劼丨公民参与的数字化“回声”：信息公开如何塑造意见表达

魏远山丨智能时代政府治理算法化的优势、困境与应对策略

宋锴业丨制造灵活性：数字治理的组织生态及其制度环境——基于M省A市的实证分析

专题研讨：实验方法研究